智能论文笔记

The Untold Impact of Learning Approaches on Software Fault-Proneness Predictions

Mohammad Jamil Ahmad , Katerina Goseva-Popstojanova , Robyn R. Lutz

分类：机器学习

2022-07-12

软件错误预测预测是一个活跃的研究领域，许多因素影响了预测性能。但是，除了一项初始工作外，尚未研究学习方法（即，用于培训和预测目标变量的数据的细节）对预测性能的影响。本文探讨了两种学习方法的影响，即Useallpredictall和usePredictPost，对软件错误预测预测的性能，包括释放内部和跨释放。经验结果基于从十二个开源项目的64个版本中提取的数据。结果表明，学习方法对分类表现有实质性的，通常未被承认的影响。具体而言，使用USEALLPREDICTALL导致的性能要比使用释放和跨释放的UsePrepredictPost学习方法要好得多。此外，本文发现，对于释放内部预测，分类性能的这种差异是由于两种学习方法中的类不平衡级别引起的。解决课堂失衡时，消除了学习方法之间的性能差异。我们的发现暗示，应始终明确识别学习方法及其对软件缺陷预订预测的影响。本文最后讨论了我们的研究和实践结果的潜在后果。

translated by 谷歌翻译

HERDPhobia: A Dataset for Hate Speech against Fulani in Nigeria

Saminu Mohammad Aliyu , Gregory Maksha Wajiga , Muhammad Murtala , Shamsuddeen Hassan Muhammad , Idris Abdulmumin , Ibrahim Said Ahmad

分类：自然语言处理

2022-11-28

Social media platforms allow users to freely share their opinions about issues or anything they feel like. However, they also make it easier to spread hate and abusive content. The Fulani ethnic group has been the victim of this unfortunate phenomenon. This paper introduces the HERDPhobia - the first annotated hate speech dataset on Fulani herders in Nigeria - in three languages: English, Nigerian-Pidgin, and Hausa. We present a benchmark experiment using pre-trained languages models to classify the tweets as either hateful or non-hateful. Our experiment shows that the XML-T model provides better performance with 99.83% weighted F1. We released the dataset at https://github.com/hausanlp/HERDPhobia for further research.

translated by 谷歌翻译

Optimization of FPGA-based CNN Accelerators Using Metaheuristics

Sadiq M. Sait , Aiman El-Maleh , Mohammad Altakrouri , Ahmad Shawahna

分类：神经与进化计算 | 计算机视觉

2022-09-22

近年来，卷积神经网络（CNN）证明了它们在许多领域解决问题的能力，并且以前无法进行准确性。但是，这带有广泛的计算要求，这使得普通CPU无法提供所需的实时性能。同时，FPGA对加速CNN推断的兴趣激增。这是由于他们有能力创建具有不同级别的并行性的自定义设计。此外，与GPU相比，FPGA提供每瓦的性能更好。基于FPGA的CNN加速器的当前趋势是实现多个卷积层处理器（CLP），每个处理器都针对一层层量身定制。但是，CNN体系结构的日益增长的复杂性使得优化目标FPGA设备上可用的资源，以使最佳性能更具挑战性。在本文中，我们提出了CNN加速器和随附的自动设计方法，该方法采用元启发式学来分区可用的FPGA资源来设计多CLP加速器。具体而言，提出的设计工具采用模拟退火（SA）和禁忌搜索（TS）算法来查找所需的CLP数量及其各自的配置，以在给定的目标FPGA设备上实现最佳性能。在这里，重点是关键规格和硬件资源，包括数字信号处理器，阻止RAM和芯片内存储器带宽。提出了使用四个众所周知的基准CNN的实验结果和比较，表明所提出的加速框架既令人鼓舞又有前途。基于SA-/TS的多CLP比在加速Alexnet，Squeezenet 1.1，VGGNET和Googlenet架构上的最新单个/多CLP方法高1.31x-2.37倍高2.37倍。和VC709 FPGA板。

translated by 谷歌翻译

Application of Machine Learning for Online Reputation Systems

Ahmad Alqwadri , Mohammad Azzeh , Fadi Almasalha

分类：机器学习 | 人工智能

2022-09-10

互联网上的用户通常需要场地来提供更好的购买建议。这可以由声誉系统提供，该系统处理评级以提供建议。评级汇总过程是声誉系统的主要部分，旨在产生有关产品质量的全球意见。经常使用的幼稚方法不会在其计算中考虑消费者概况，也无法发现新评级中出现的不公平评级和趋势。使用加权平均技术的其他复杂评级聚合方法集中在消费者概况数据的一个或几个方面。本文提出了使用机器学习的新信誉系统，以预测消费者资料中消费者的可靠性。特别是，我们通过提取一组对消费者可靠性影响的因素来构建新的消费者资料数据集，这些因素是机器学习算法的输入。然后将预测的权重与加权平均方法集成，以计算产品信誉评分。已使用10倍交叉验证对三个Movielens基准数据集进行了评估。此外，已将提出模型的性能与以前已发布的评级聚合模型进行了比较。获得的结果很有希望，这表明所提出的方法可能是声誉系统的潜在解决方案。比较结果证明了我们模型的准确性。最后，建议的方法可以与在线推荐系统集成在一起，以提供更好的购买建议并促进在线购物市场上的用户体验。

translated by 谷歌翻译

Deep Sequence Models for Text Classification Tasks

Saheed Salahudeen Abdullahi , Sun Yiming , Shamsuddeen Hassan Muhammad , Abdulrasheed Mustapha , Ahmad Muhammad Aminu , Abdulkadir Abdullahi , Musa Bello , Saminu Mohammad Aliyu

分类：自然语言处理 | 人工智能 | 机器学习

2022-07-18

当前信息时代在互联网上产生的数据的指数增长是数字经济的推动力。信息提取是累积大数据中的主要价值。对统计分析和手工设计的规则机器学习算法的大数据依赖性被人类语言固有的巨大复杂性所淹没。自然语言处理（NLP）正在装备机器，以了解这些人类多样化和复杂的语言。文本分类是一个NLP任务，它会自动识别基于预定义或未定标记的集合的模式。常见的文本分类应用程序包括信息检索，建模新闻主题，主题提取，情感分析和垃圾邮件检测。在文本中，某些单词序列取决于上一个或下一个单词序列以使其充分含义。这是一项具有挑战性的依赖性任务，要求机器能够存储一些以前的重要信息以影响未来的含义。诸如RNN，GRU和LSTM之类的序列模型是具有长期依赖性任务的突破。因此，我们将这些模型应用于二进制和多类分类。产生的结果非常出色，大多数模型在80％和94％的范围内执行。但是，这个结果并不详尽，因为我们认为如果机器要与人类竞争，可以改进。

translated by 谷歌翻译

GMFIM: A Generative Mask-guided Facial Image Manipulation Model for Privacy Preservation

Mohammad Hossein Khojaste , Nastaran Moradzadeh Farid , Ahmad Nickabadi

分类：计算机视觉

2022-01-10

使用社交媒体网站和应用程序已经变得非常受欢迎，人们在这些网络上分享他们的照片。在这些网络上自动识别和标记人们的照片已经提出了隐私保存问题，用户寻求隐藏这些算法的方法。生成的对抗网络（GANS）被证明是非常强大的在高多样性中产生面部图像以及编辑面部图像。在本文中，我们提出了一种基于GAN的生成掩模引导的面部图像操纵（GMFIM）模型，以将无法察觉的编辑应用于输入面部图像以保护图像中的人的隐私。我们的模型由三个主要组件组成：a）面罩模块将面积从输入图像中切断并省略背景，b）用于操纵面部图像并隐藏身份的GaN的优化模块，并覆盖身份和c）用于组合输入图像的背景和操纵的去识别的面部图像的合并模块。在优化步骤的丢失功能中考虑了不同的标准，以产生与输入图像一样类似的高质量图像，同时不能通过AFR系统识别。不同数据集的实验结果表明，与最先进的方法相比，我们的模型可以实现对自动面部识别系统的更好的性能，并且它在大多数实验中捕获更高的攻击成功率。此外，我们提出的模型的产生图像具有最高的质量，更令人愉悦。

translated by 谷歌翻译

A Deep Learning Based Automated Hand Hygiene Training System

Mobina Shahbandeh , Fatemeh Ghaffarpour , Sina Vali , Mohammad Amin Haghpanah , Amin Mousavi Torkamani , Mehdi Tale Masouleh , Ahmad Kalhor

分类：计算机视觉 | 机器学习

2021-12-10

手工卫生对于预防病毒和感染是至关重要的。由于Covid-19的普遍爆发，戴着面具和手工卫生似乎是公众遏制这些病毒的传播最有效的方式。世界卫生组织（世卫组织）建议在八个步骤中推荐一支基于酒精的手摩擦的指导，以确保所有手表的手都完全干净。由于这些步骤涉及复杂的手势，对它们的人为评估缺乏足够的准确性。然而，深度神经网络（DNN）和机器视觉使得能够为培训和反馈的目的准确地评估手摩擦质量。本文介绍了一种具有实时反馈的自动化深度学习的手RUB评估系统。该系统使用在从志愿者收集的视频数据集上培训的DNN架构来评估符合8步指南的遵守情况，并在手动摩擦指南之后的各种肤色和手部特征。测试了各种DNN架构，并且成立型号的模型导致了97％的测试精度的最佳效果。在建议的系统中，NVIDIA Jetson Agx Xavier嵌入板运行软件。在各种用户使用的具体情况下评估系统的功效，并确定具有挑战性的步骤。在这个实验中，志愿者中手摩擦步骤的平均时间是27.2秒，符合世卫组织指导方针。

translated by 谷歌翻译

Vehicle trajectory prediction works, but not everywhere

Mohammadhossein Bahari , Saeed Saadatnejad , Ahmad Rahimi , Mohammad Shaverdikondori , Mohammad Shahidzadeh , Seyed-Mohsen Moosavi-Dezfooli , Alexandre Alahi

分类：计算机视觉

2021-12-07

现在是车辆轨迹预测是自动驾驶汽车的基本支柱。行业和研究社区都通过运行公共基准来承认这一柱的需求。而最先进的方法令人印象深刻，即，他们没有越野预测，他们对基准之外的城市的概括是未知的。在这项工作中，我们表明这些方法不会概括为新场景。我们提出了一种新颖的方法，可自动生成逼真的场景，导致最先进的模型越野。我们通过对抗场景生成的镜头来框架问题。我们推广基于原子场景生成功能的简单而有效的生成模型以及物理约束。我们的实验表明，可以在制作预测方法失败的方式中修改来自当前基准的超过60 000 \％$ 60 \％。我们进一步表明（i）生成的场景是现实的，因为它们确实存在于现实世界中，并且（ii）可用于使现有型号强大30-40％。代码可在https://sattack.github.io/处获得。

translated by 谷歌翻译

CT-SGAN: Computed Tomography Synthesis GAN

Ahmad Pesaranghader , Yiping Wang , Mohammad Havaei

分类：计算机视觉

2021-10-14

数据的多样性对于对深度学习模型的成功培训至关重要。通过经常发生的生成对抗网络杠杆，我们提出了在胸部CT扫描的小型数据集上培训时产生大规模3D合成CT-SCAN卷（$ \ GEQ224 \ Times224 $）的CT-SGAG。CT-SGAN为医学成像机器学习面临的两个主要挑战提供有吸引力的解决方案：少数给定的I.I.D。培训数据，以及对患者数据共享的限制，防止迅速获得更大和更多样化的数据集。我们使用包括FR \'电位距离和成立分数的各种度量来评估生成的图像的保真度和定量。我们进一步表明，通过在大量合成数据上预先训练分类器，CT-SGAN可以显着提高肺结核检测精度。

translated by 谷歌翻译

Look, Listen, and Attack: Backdoor Attacks Against Video Action Recognition

Hasan Abed Al Kader Hammoud , Shuming Liu , Mohammad Alkhrasi , Fahad AlBalawi , Bernard Ghanem

分类：计算机视觉 | 机器学习

2023-01-03

Deep neural networks (DNNs) are vulnerable to a class of attacks called "backdoor attacks", which create an association between a backdoor trigger and a target label the attacker is interested in exploiting. A backdoored DNN performs well on clean test images, yet persistently predicts an attacker-defined label for any sample in the presence of the backdoor trigger. Although backdoor attacks have been extensively studied in the image domain, there are very few works that explore such attacks in the video domain, and they tend to conclude that image backdoor attacks are less effective in the video domain. In this work, we revisit the traditional backdoor threat model and incorporate additional video-related aspects to that model. We show that poisoned-label image backdoor attacks could be extended temporally in two ways, statically and dynamically, leading to highly effective attacks in the video domain. In addition, we explore natural video backdoors to highlight the seriousness of this vulnerability in the video domain. And, for the first time, we study multi-modal (audiovisual) backdoor attacks against video action recognition models, where we show that attacking a single modality is enough for achieving a high attack success rate.

translated by 谷歌翻译